# 获取网页源码
# 解析 解析的是服务器相应的文件

import urllib.request
from lxml import etree

url = 'https://www.baidu.com'

headers = {
    "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 Safari/537.36 Edg/130.0.0.0',
}

# 请求对象的定制
request = urllib.request.Request(url=url, headers=headers)

# 模拟浏览器访问服务器
response = urllib.request.urlopen(request)

# 获取网页源码
content = response.read().decode('utf-8')

# 解析网页源码来获取我们想要的数据
# 解析服务器相应的文件
tree = etree.HTML(content)


# 获取想要的数据
result=tree.xpath('//input[@id="su"]/@value')

print(result)